☰
10.2.1 탐험(Exploration)과 이용(Exploitation)의 균형: 엔트로피 정규화
Home
/
인공지능 (Artificial Intelligence, AI)
/
제목: Embodied AI & Modern Control
/
Chapter 10. 심층 강화학습(Deep RL)의 고도화
/
10.2 최대 엔트로피 강화학습 (Maximum Entropy RL): Soft Actor-Critic (SAC)
/
10.2.1 탐험(Exploration)과 이용(Exploitation)의 균형: 엔트로피 정규화
10.2.1 탐험(Exploration)과 이용(Exploitation)의 균형: 엔트로피 정규화